লিনিয়ার রিগ্রেশন (Linear Regression)
লিনিয়ার রিগ্রেশন একটি পরিসংখ্যানগত পদ্ধতি যা দুটি বা তার অধিক ভেরিয়েবলের মধ্যে সম্পর্ক মডেল করতে ব্যবহৃত হয়। এটি মূলত ভবিষ্যদ্বাণী করতে এবং দুইটি বা তার বেশি ভেরিয়েবলের মধ্যে সম্পর্ক বিশ্লেষণ করতে ব্যবহার করা হয়।
লিনিয়ার রিগ্রেশন মূলত দুটি ধাপে বিভক্ত: সিম্পল লিনিয়ার রিগ্রেশন (Simple Linear Regression) এবং মাল্টিপল লিনিয়ার রিগ্রেশন (Multiple Linear Regression)। চলুন, এই দুটি ধরণের রিগ্রেশন বিশ্লেষণ করি।
১. সিম্পল লিনিয়ার রিগ্রেশন (Simple Linear Regression)
সিম্পল লিনিয়ার রিগ্রেশন হল এমন একটি পদ্ধতি, যেখানে একটি নির্দিষ্ট স্বাধীন পরিবর্তনশীল (Independent Variable) এর মাধ্যমে একটি নির্ভরশীল পরিবর্তনশীল (Dependent Variable) এর সম্পর্ক নির্ধারণ করা হয়। এটি মূলত দুটি ভেরিয়েবল বা কলামের মধ্যে সরল রেখার সম্পর্ক তৈরি করে। সিম্পল লিনিয়ার রিগ্রেশন মূলত একটি স্বাধীন পরিবর্তনশীল এবং একটি নির্ভরশীল পরিবর্তনশীলের মধ্যে সম্পর্ক স্থাপন করে।
সিম্পল লিনিয়ার রিগ্রেশন সমীকরণ:
Y = β₀ + β₁ * X + ε
এখানে,
- Y = নির্ভরশীল ভেরিয়েবল (Dependent Variable)
- X = স্বাধীন ভেরিয়েবল (Independent Variable)
- β₀ = ইন্টারসেপ্ট (Intercept)
- β₁ = স্লোপ (Slope) বা X এর প্রতি Y এর পরিবর্তন
- ε = ত্রুটি বা রেসিডুয়াল (Error Term)
উদাহরণ:
ধরা যাক, আপনি একটি কোম্পানির বিজ্ঞাপন খরচ (X) এবং বিক্রির পরিমাণ (Y) এর মধ্যে সম্পর্ক খুঁজে বের করতে চান। এখানে, বিজ্ঞাপন খরচ হবে X এবং বিক্রির পরিমাণ হবে Y। সিম্পল লিনিয়ার রিগ্রেশন ব্যবহার করে আপনি একটি সরল রেখা পেতে পারেন যা বিজ্ঞাপন খরচ এবং বিক্রির পরিমাণের মধ্যে সম্পর্ক দেখায়।
২. মাল্টিপল লিনিয়ার রিগ্রেশন (Multiple Linear Regression)
মাল্টিপল লিনিয়ার রিগ্রেশন হল এমন একটি পদ্ধতি, যেখানে একাধিক স্বাধীন পরিবর্তনশীল (Independent Variables) ব্যবহার করে একটি নির্ভরশীল পরিবর্তনশীলের (Dependent Variable) পূর্বানুমান করা হয়। এটি একাধিক স্বাধীন ভেরিয়েবল এবং একটি নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্ক বিশ্লেষণ করে। এটি সিম্পল লিনিয়ার রিগ্রেশন থেকে কিছুটা জটিল, কারণ এখানে একাধিক ভেরিয়েবল (X₁, X₂, ...) ব্যবহার করা হয়।
মাল্টিপল লিনিয়ার রিগ্রেশন সমীকরণ:
Y = β₀ + β₁ * X₁ + β₂ * X₂ + ... + βn * Xn + ε
এখানে,
- Y = নির্ভরশীল ভেরিয়েবল (Dependent Variable)
- X₁, X₂, ..., Xn = স্বাধীন ভেরিয়েবল (Independent Variables)
- β₀ = ইন্টারসেপ্ট (Intercept)
- β₁, β₂, ..., βn = প্রতিটি স্বাধীন পরিবর্তনশীলের জন্য স্লোপ বা প্যারামিটার
- ε = ত্রুটি বা রেসিডুয়াল (Error Term)
উদাহরণ:
ধরা যাক, আপনি একটি বাড়ির দাম (Y) পূর্বানুমান করতে চান। এখানে বাড়ির আয়তন (X₁), কক্ষের সংখ্যা (X₂), অবস্থান (X₃) ইত্যাদি পরিবর্তনশীল একাধিক ফিচার হিসেবে থাকবে। মাল্টিপল লিনিয়ার রিগ্রেশন ব্যবহার করে আপনি একাধিক বৈশিষ্ট্য নিয়ে বাড়ির দাম পূর্বানুমান করতে পারবেন।
সিম্পল এবং মাল্টিপল লিনিয়ার রিগ্রেশনের মধ্যে পার্থক্য:
| দিক | সিম্পল লিনিয়ার রিগ্রেশন | মাল্টিপল লিনিয়ার রিগ্রেশন |
|---|---|---|
| পরিবর্তনশীল | একটি স্বাধীন পরিবর্তনশীল এবং একটি নির্ভরশীল পরিবর্তনশীল | একাধিক স্বাধীন পরিবর্তনশীল এবং একটি নির্ভরশীল পরিবর্তনশীল |
| রেখার সংখ্যা | একটি সরল রেখা | একাধিক ডাইমেনশনাল রেখা বা পৃষ্ঠ |
| উদাহরণ | বিজ্ঞাপন খরচ এবং বিক্রির পরিমাণের মধ্যে সম্পর্ক | বাড়ির দাম পূর্বানুমান করতে আয়তন, কক্ষের সংখ্যা, অবস্থান ইত্যাদি ব্যবহার |
| পদ্ধতি | সহজ, এক মাত্র পরিবর্তনশীল | জটিল, একাধিক পরিবর্তনশীল |
উপসংহার:
- সিম্পল লিনিয়ার রিগ্রেশন একটি মাত্র স্বাধীন পরিবর্তনশীলের মাধ্যমে নির্ভরশীল পরিবর্তনশীলের সম্পর্ক বিশ্লেষণ করে এবং একটি সরল রেখা তৈরি করে।
- মাল্টিপল লিনিয়ার রিগ্রেশন একাধিক স্বাধীন পরিবর্তনশীলের মাধ্যমে নির্ভরশীল পরিবর্তনশীলের সম্পর্ক বিশ্লেষণ করে এবং একটি বহু-মাত্রিক সম্পর্ক তৈরি করে।
এগুলো মেশিন লার্নিংয়ের প্রাথমিক এবং অত্যন্ত গুরুত্বপূর্ণ অ্যালগরিদম, যেগুলি ভবিষ্যদ্বাণী এবং ডেটা বিশ্লেষণে ব্যাপকভাবে ব্যবহৃত হয়।
Read more